package 春招冲刺百题计划;

import java.util.ArrayList;
import java.util.HashSet;
import java.util.List;
import java.util.Set;

/**
 * Created with IntelliJ IEDA.
 * Description:
 * User:86186
 * Date:2024-05-05
 * Time:21:41
 */

/**
 * 春招冲刺百题计划:187. 重复的DNA序列
 * 已解答
 * 中等
 * 相关企业
 * DNA序列 由一系列核苷酸组成，缩写为 'A', 'C', 'G' 和 'T'.。
 *     例如，"ACGAATTCCG" 是一个 DNA序列 。
 * 在研究 DNA 时，识别 DNA 中的重复序列非常有用。
 * 给定一个表示 DNA序列 的字符串 s ，返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。
 * 示例 1：
 * 输入：s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
 * 输出：["AAAAACCCCC","CCCCCAAAAA"]
 */
public class findRepeatedDnaSequences {
    public List<String> findRepeatedDnaSequences(String s) {
        Set<String> seen = new HashSet<>();
        Set<String> ans = new HashSet<>();
        for (int i = 0;i < s.length() - 9;i++){
            if (!seen.add(s.substring(i,i + 10))){
                ans.add(s.substring(i,i + 10));
            }
        }
        List<String> res = new ArrayList<>();
        res.addAll(ans);
        return res;
    }
}
